token

李彦宏开卷:“DeepSeek慢且贵”

在今天百度文心大模型4.5 Turbo、文心大模型X1 Turbo发布时,百度创始人李彦宏就吐槽DeepSeek也不是万能的。除了能力上只能处理文本,还不能理解和生成图片、音频、视频等多媒体内容、幻觉率高外,李彦宏认为使用DeepSeek更大的问题是慢和贵,“

gemini 文心 李彦宏 deepseek token 2025-04-25 19:00  9

推理模型其实无需「思考」?

当 DeepSeek-R1、OpenAI o1 这样的大型推理模型还在通过增加推理时的计算量提升性能时,加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹: 别再卷 token 了,无需显式思维链,推理模型也能实现高效且准确的推理。

推理模型 thinking token nothinking 2025-04-19 19:07  17

大神谈deepseek及大模型心理学

最新,大神安德烈·卡帕西(Andrej Karpathy)放出一段视频1,通俗易懂、深入浅出、旁征博引地介绍了大模型工作原理,其中多次谈及deepseek,并从心理学层面分析了大模型的特点、弱点和解决方法。内容非常精彩,任何学习大模型的人,都值得一看。

模型 心理学 deepseek 杨立 token 2025-04-17 16:20  12

大模型 Token 的消耗可能是一笔糊涂账

经典的 Web 应用,例如电商、游戏、出行、新能源、教育和医疗等,CPU 的消耗是可控的,和应用的在线人数和登陆时长成正相关,如果计算资源突增,可能是运营团队在做活动,也可能是预期外的突发流量,通过服务器弹性扩容后,稳定一段时间就会缩容到平时的状态,后端所消耗

模型 agent mcp token 模型token 2025-04-02 16:11  11